Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Dilema do prisioneiro
1. Introdução à Informática – Prof. Msc. João Carlos
Nome: *********
Matrícula: ******
DILEMA DO PRISIONEIRO
O dilema do prisioneiro é um problema da teoria dos jogos e um exemplo claro, mas
atípico, de um problema de soma não nula. Neste problema, como em outros muitos, supõe-se
que cada jogador, de modo independente, quer aumentar ao máximo a sua própria vantagem
sem lhe importar o resultado do outro jogador.
Em jogo de soma-zero o beneficio total para todos os jogadores, para cada
combinação de estratégias, sempre somam zero (ou falando mais informalmente, um jogador
só lucra com base no prejuízo de outro). O Poker exemplifica um jogo de soma zero
(ignorando possíveis vantagens da mesa), porque o vencedor recebe exatamente a soma das
perdas de seus oponentes. A maioria dos jogos clássicos de tabuleiro é de soma zero,
incluindo o Xadrez. Muitos dos jogos estudados pelos pesquisadores da teoria dos jogos são
jogos de soma não nula, porque algumas saídas têm resultados combinados maior ou menor
que zero. Informalmente, em jogos de soma diferente de zero, o ganho de um dos jogadores
não necessariamente corresponde à perda dos outros.É possível transformar qualquer jogo
em um jogo de soma zero pela adição de jogadores espúrios (freqüentemente chamados de o
tabuleiro), para o qual as perdas compensam o total alcançado pelos vencedores.
As técnicas de análise da teoria de jogos padrão - por exemplo determinar o equilíbrio
de Nash - podem levar cada jogador a escolher trair o outro, mas curiosamente ambos os
jogadores obteriam um resultado melhor se colaborassem. Infelizmente (para os prisioneiros),
1
2. Introdução à Informática – Prof. Msc. João Carlos
cada jogador é incentivado individualmente para defraudar o outro, mesmo após lhe ter
prometido colaborar. Este é o ponto-chave do dilema.
O Equilíbrio de Nash representa uma situação em que, em um jogo envolvendo dois
ou mais jogadores, nenhum jogador tem a ganhar mudando sua estratégia unilateralmente.
Se cada jogador escolheu sua estratégia, e nenhum deles pode se beneficiar apenas pela
alteração de sua estratégia enquanto os demais jogadores conservam as deles, então as
escolhas estratégicas e as penalizações do jogo configuram um "equilíbrio de Nash". (à
esquerda o matemático John Nash)
No dilema do prisioneiro iterado, a cooperação pode obter-se como um resultado de
equilíbrio. Aqui joga-se repetidamente, pelo que, quando se repete o jogo, oferece-se a cada
jogador a oportunidade de castigar ao outro jogador pela não cooperação em jogos anteriores.
Assim, o incentivo para defraudar pode ser superado pela ameaça do castigo, o que conduz a
um resultado melhor, cooperativo.
O dilema do prisioneiro foi originalmente formulado por Merrill Flood e Melvin
Dresher enquanto trabalhavam na RAND em 1950. Mais tarde, Albert W. Tucker fez a sua
formalização com o tema da pena de prisão e deu ao problema geral esse nome específico. O
dilema do prisioneiro (DP) dito clássico funciona da seguinte forma:
"Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes
para os condenar, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um
dos prisioneiros, confessando, testemunhar contra o outro e esse outro permanecer em
silêncio, o que confessou sai livre enquanto o cúmplice silencioso cumpre 10 anos de
sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 6 meses de cadeia
cada um. Se ambos traírem o comparsa, cada um leva 5 anos de cadeia. Cada prisioneiro
faz a sua decisão sem saber que decisão o outro vai tomar, e nenhum tem certeza da
decisão do outro. A questão que o dilema propõe é: o que vai acontecer? Como o
prisioneiro vai reagir?"
2
3. Introdução à Informática – Prof. Msc. João Carlos
O fato é que pode haver dois vencedores no jogo, sendo esta última solução a melhor
para ambos, quando analisada em conjunto. Entretanto, os jogadores confrontam-se com
alguns problemas:
Confiam no cúmplice e permanecem negando o crime, mesmo correndo o risco de
serem colocados numa situação ainda pior, ou confessam e esperam ser libertados, apesar de
que, se ele fizer o mesmo, ambos ficarão numa situação pior do que se permanecessem
calados?
Um experimento baseado no simples dilema encontrou que cerca de 40% de
participantes cooperaram (i.e., ficaram em silêncio).
Em abstrato, não importa os valores das penas, mas o cálculo das vantagens de uma
decisão cujas conseqüências estão atreladas às decisões de outros agentes, onde a confiança e
traição fazem parte da estratégia em jogo.
Casos como este são recorrentes na economia, na biologia e na estratégia. O estudo
das táticas mais vantajosas num cenário onde esse dilema se repita é um dos temas da teoria
dos jogos.
Retirado do site: http://loversofmath.blogspot.com/
3